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Resumen. Existen factores que miden el desempeño de los servicios de 
salud, uno de ellos es el acceso rápido y eficiente a la atención. La gestión 
del acceso a estos servicios para disminuir la espera en pacientes y usuarios 
ha sido un tema de relevancia a nivel de políticas públicas. En Chile uno de 
los mayores desafíos es proporcionar un sistema de asignación de citas 
médicas, especialmente en la red pública de Asistencia Primaria de Salud 
(APS). Algunas de las iniciativas son procedimientos administrativos, pero 
pocas de ellas están en el ámbito de la transformación digital. Esta 
investigación tiene como objetivo estudiar diferentes algoritmos de 
aprendizaje automático, entre los que destacan K-vecinos más cercanos, 
bosques aleatorios, árbol de decisión y máquinas de soporte vectorial. El 
objetivo es clasificar las citas médicas de acuerdo con las preferencias de 
usuario y restricciones de recursos, basados en los datos obtenidos de 
experiencias previas. Se evalúa el potencial de aplicación de estos algoritmos 
para gestionar un sistema de asignación de citas. Los resultados son aún 
conservadores, y ponen de manifiesto la necesidad de optimizar los 
parámetros asociados a estos algoritmos para garantizar una asignación 
eficiente de citas a los usuarios del sistema. 


Palabras claves: Aprendizaje automático, Planificación de citas, Sistema 
primario de salud. 


Abstract. There are factors that measure the performance of health services, 
like efficient healthcare access. Managing access to these services to reduce 
waiting times for patients and users has been a relevant issue at the level of 
public policies. In Chile, one of the biggest challenges is to provide a system 
for assigning medical appointments, especially in the public network of 
Primary Health Care (PHC). Some of the initiatives are administrative 
procedures, but few of them are in the realm of digital transformation. This 
research aims to study different machine learning algorithms, including K- 
nearest neighbors, random forests, decision trees, and support vector 
machines. The goal is to classify medical appointments according to user 
preferences and resource constraints, based on data obtained from previous 
experiences. The potential application of these algorithms to manage an 
appointment assignment system is evaluated. The results are still 
conservative and highlight the need to optimize the parameters associated 
with these algorithms to ensure an efficient allocation of citations to system 
users. 


Keywords: Machine Learning, Appointment Scheduling, Primary Health 
System. 
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1. INTRODUCCIÓN 


El sistema de Atención Primaria de Salud (APS) cumple un rol importante para la atención oportuna a usuarios 
de la red pública de salud, según Bass del Campo (2012), sin embargo, los pacientes del APS tienen un tiempo de 
demora alto no solo para programar una cita médica sino también el tiempo que transcurre para la atención (Bedregal 
y otros. 2009). Las personas que son parte de la APS deben esperar largas horas desde muy temprano para poder 
obtener una cita médica. La espera involucra que el paciente deja de percibir un ingreso debido a que dejan de trabajar 
todo su turno en algunos casos para obtener la cita médica, el traslado es otra variable que incide ejemplo de ello son 
los pacientes que se trasladan desde sus hogares hacia el establecimiento de salud tardan horas en realizar el recorrido, 
debido a las condiciones geográficas que presentan las zonas rurales (Jiménez, 2018). 

Los tiempos de espera prolongados y las deficiencias de acceso a las instalaciones de salud impactan 
negativamente a los pacientes y eventualmente a sus acompañantes, quienes presentan altos niveles de estrés a causa 
del alto flujo de personas que demandan el servicio. (Pesse-Sorensen, Fuentes-García $ llabaca, 2019). Un paciente 
de avanzada edad irá acompañado y el acompañante también deberá disponer de su tiempo, una madre con hijos, un 
paciente con enfermedades crónicas y una mujer embarazada posiblemente todos tendrán que disponer del día 
completo para poder obtener la cita y posteriormente ser atendidos (Ansell et al., 2017). 

Los largos tiempos de espera están explicados por una serie de factores que influyen en la programación de citas 
médicas. Estos factores pueden ser la escasa disponibilidad, la hora en el que el paciente se levanta para lograr 
conseguir un número de atención, el turno del paciente en el que queda para que le asignen la hora médica y su 
posterior atención. Adicionalmente, factores externos como la limitada oferta de horas disponibles en las 
infraestructuras de salud pública (Brandenburg et al., 2015). 

Además, existen pacientes que no asisten a sus citas dejando sin atención a pacientes que sí necesitan atención 
de manera urgente (Salazar et al., 2020). Todo ello ofrece evidencia de que existe un problema de gestión de asignación 
de citas latentes en los sistemas públicos de salud, lo que conlleva principalmente a costos en tiempos de espera y 
atención a la cita médica o no médica (Coloma y otros. 2020). La entrega de un servicio mejorado en la programación 
de citas y acceso de los pacientes ayuda a reducir el estrés, costos de atención y reavivar la satisfacción en la prestación 
del servicio de salud público. 

La pregunta de investigación es si es posible optimizar el agendamiento de citas médicas de APS usando métodos 
de aprendizaje automático, reduciendo el impacto negativo en la población objetivo. A la fecha, no hay estudios que 
han tratado de crear una solución para esta problemática. 


2. ANTECEDENTES TEÓRICOS 


2.1. Sistemas de salud 


Los sistemas de salud en el mundo son diferentes debido a la combinación de factores que son considerados para 
su establecimiento (Schiitte, Acevedo « Flahault, 2018). Los factores que se miden son esencialmente la tasa de 
mortalidad y natalidad de la población, la fuerza laboral y la infraestructura hospitalaria que incluye las instalaciones, 
número de camas y acceso a la salud (Durrani, 2016). La expansión en la atención hospitalaria se ha desarrollado 
principalmente alrededor de centros urbanos o cercanos a estos lo que lleva a una distribución desigual de las 
instalaciones de salud, acceso a camas y atención primaria. Las variaciones en la asignación pública al servicio de 
salud a nivel global conllevan a la disminución en la calidad de los servicios y alcance de los recursos humanos de 
salud (Bloom, Khoury $ Subbaraman, 2018). 

La comparación de servicios de salud se puede dar por el tiempo de espera para ser atendidos, según Dixit $ 
Sambasivan (2018), realizaron un estudio de los servicios de salud, en el encontraron que en Australia 10% de los 
pacientes tiene que esperar hasta cuatro meses para cirugías electivas, mientras que en Canadá solo un 4% de los 
pacientes deben esperar. Así mismo, solo 7% de los pacientes en Francia han experimentados problemas de 
coordinación o programación de servicios de salud y en Estados Unidos los pacientes experimentan un problema con 
las altas médicas en un 28%. Uno de los sistemas de salud más costoso y de peor desempeño es el estadounidense a 
pesar de ser uno de los países más industrializados (Ahluwalia et al., 2017). Lo que implica que no necesariamente un 
buen servicio de salud está relacionado con el desarrollo del país. Debido a las limitaciones de capacidad, algunos 
pacientes deben ser agregados a listas de espera, para recibir tratamientos o ser atendidos. Esto trae implicaciones para 
los pacientes como son 1) largas listas de espera, 2) algunos pacientes no pueden esperar su turno para ser atendidos 
y recurren al sistema privado, 3) el costo administrativo de las listas y 4) las listas de espera ponen en desuso las camas 
que están disponibles. Estas listas no incluyen el acceso a servicio de citas médicas que es otro problema de los 
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servicios de salud. Muchos de los esfuerzos están enfocados en el servicio de atención primaria con la inclusión de 
sistemas de información de alto desempeño. 

El sistema de salud chileno es un sistema mixto que consta de dos sectores; público y privado (Almeida, Oliveira 
á Giovanella, 2018). El sector público cubre al 80% de la población en su mayoría a través del Fondo Nacional de 
Salud (FONASA) por medio del Sistema Nacional de Servicios de Salud (SNSS) y la red de Servicios de Salud 
Regional y el Sistema Municipal de Atención Primaria. Este incluye las atenciones primarias y hospitalarias. El sector 
privado está constituido por las instituciones de Salud Previsional (ISAPRES), que proveen servicios a través de 
instalaciones privadas como públicas (Almeida, Oliveira 8 Giovanella, 2018). 

En un esfuerzo por establecer un sistema de información que permitiera impulsar una estrategia y un plan de 
acción para digitalizar los establecimientos que conforman la red asistencial de salud de Chile se estableció a través 
de la Subsecretaria de Redes Asistenciales creo en el 2008 el Sistema de Información de la Red Asistencial (SIDRA). 
(Reynaldos-Grandón, Saiz-Alvarez 8: Molina-Muñoz, 2018). Inicialmente permitió apoyar los procesos básicos de 
informatización, dando prioridad a la Agenda, referencia y control de referencia, registro de población de control, 
dispensación de fármacos y urgencia. Los cuales se encuentran incorporados en diferentes grados de implementación 
y alcance de componentes en distintos establecimientos de salud de la red local. 


2.2 Tiempos de espera y programación de citas de pacientes 


El tiempo de acceso a citas en la atención primaria genera gastos emocionales, psicológicos que pueden agravar 
condiciones preexistentes en la población, así como costos económicos del sistema médico por costos de coordinación 
de personal y tiempos de atención. (Ansell et al., 2017). Del mismo modo, las citas médicas que no son atendidas bien 
sean por la inasistencia de los pacientes, médicos o por otras razones generan pérdida de recursos, desorganización de 
los servicios entre otros problemas (Salazar et al. 2020). 

Los tiempos de espera para atención médica en servicios de salud público chileno, en especial los consultorios 
periféricos suelen ser prolongados. Los pacientes deben asistir con horas de antelación para ser atendidos o esperar en 
listas de esperas por algunos servicios (Almeida, Oliveira % Giovanella, 2018). El sistema de salud pública y su 
enfoque actual presenta inequidad e ineficiencia en cuanto a la atención y asignación de citas (Annick , 2002). 
Ninguna otra institución trabaja tan contra reloj como el servicio de salud. Sin embargo, la falta de personal y cambios 
en turnos de trabajo hace que el personal esté insatisfecho y por consiguiente influye en la satisfacción de los pacientes 
(Abdalkareem et al., 2021). El incremento de la expectativa de vida de la población lleva un incremento en la demanda 
de servicios médicos (Rais $ Viana, 2011). Por tanto, se requiere la mejora en la asignación de recursos y personal 
en los servicios médicos, como un sistema de citas. 

Un sistema de citas efectivo debe abarcar la demanda basado en la capacidad de asignación de recursos de manera 
eficiente y que disminuya el tiempo de espera de los pacientes, mejorar el acceso a los servicios médicos y tener un 
impacto en la calidad de las operaciones en los servicios de salud (Abdalkareem et al., 2021). Mejorar la eficiencia en 
el sistema de salud tiene el potencial no solo de disminuir costos sino facilitar el acceso igualitario a la salud (Batun 
á Begen, 2013). La atención de pacientes en centro de atención primaria de salud (APS) puede mejorar la flexibilidad 
en la asignación de citas disminuyendo los cuellos de botella en asignación de recursos y disponibilidad de 
profesionales (Murray 8 Berwick, 2003). Adicionalmente, un acceso avanzado a la salud reduce los tiempos de espera, 
restricciones a ciertos días de la semana y horarios diarios. Si bien puede parecer que se crean días con múltiples 
asignaciones, la variación natural de la demanda y el perfilar los pacientes en realidad distribuye de manera uniforme 
todo el calendario de citas. 


2.3 Máquinas de aprendizaje para horarios de atención en servicios médicos 


Las máquinas de aprendizaje (ML) son algoritmos que permiten aprender los patrones en una serie de datos sin 
que se programen explícitamente. Existen algoritmo de ML supervisados y no supervisados (Syam 4 Sharma, 2018). 
Los supervisados son generalmente un conjunto de herramientas para clasificar y procesar datos que están etiquetados. 
Los no supervisados permiten organizar en grupos basados en características particulares entre ellos. 

Algunos algoritmos ML usados para clasificación son: Árboles de decisión, es un método que permite generar 
reglas para clasificar los datos basado en una representación con una estructura de árbol (Jahromi, Stakhovych $ 
Ewing, 2014). Bosques aleatorios que es un algoritmo que usa múltiples árboles de decisión, o estructuras de datos 
estadísticos y selecciona la mejor división de etiquetado durante entrenamiento y luego promedia para crear la 
predicción más balanceada (Salminen et al., 2019). K-vecinos más cercanos, es un método no paramétrico de 
clasificación. Requiere especificar la una función de similitud que produce valores de similitud entre pares que 
responden a una variable de interés y el número de vecinos cercanos (Arora et al., 2019; Dzyabura, Jagabathula $: 
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Muller, 2019). Naive Bayes está basado en el teorema de Bayes. El algoritmo asigna etiquetas de clases a las instancias 
problema que son representadas como vectores de valores de entidad donde las etiquetas de clase se extraen de algún 
conjunto finito (Sánchez-Franco et al., 2019). Las máquinas de soporte vectorial son métodos de clasificación que 
emplean el mapeo de un vector de entrada en un espacio hiper-dimensional de características, construyendo un modelo 
lineal que implementa clases no lineales en el espacio original (Kim, 2021). 

Recientemente, las máquinas de aprendizaje han ganado importancia en servicios de atención médica, dado su 
habilidad para mejorar el rendimiento del sistema de salud (Pianykh et al., 2020). Algunas aplicaciones de aprendizaje 
automático, tratan de predecir pacientes que no asistirán a sus citas médicas (Srinivas $ Ravindran, 2018). En este 
trabajo se evalúan cinco algoritmos de clasificación, regresión logística, redes neuronales artificiales, Bosques 
aleatorios a los algoritmos ensamblados como son Gradient Boosting y Stacking (Srinivas £ Ravindran, 2018). Otra 
aplicación usando ML pretende medir el tiempo del postoperatorio de los pacientes, basado en el tiempo de 
recuperación individual del paciente (Kempa-Liehr et al., 2020). La predicción de los tiempos de espera y retrasos en 
la asignación de citas médicas se han estudiado usando aprendizaje automático (Curtis et al., 2018). En este trabajo se 
compararon diferentes algoritmos como redes neuronales, bosques aleatorios, máquinas de soporte vectorial, redes 
elásticas, k-vecinos más cercanos entre otros. El resultado mostró que las redes elásticas generan el mejor desempeño 
y logran identificar el predictor más importante. Otro problema que se ha resuelto usando aprendizaje automático tiene 
relación con la inasistencia a las citas y el perfil de pacientes que no se presentan Salazar et al. (2020) o citas otorgadas 
en exceso o ignoradas Samorani et al. (2022) enfocándose en un modelo de asignación de citas que sea equitativo para 
todos. 


3. MATERIALES Y MÉTODOS 


3.1. Datos de estudio 


Se realizó la recolección y representación de datos con un diseño de estudio cuantitativo descriptivo transversal. 
El grupo objetivo fueron usuarios mayores de 18 años del sistema público y privado de Chile. Se obtuvieron datos de 
238 personas residentes de zonas urbanas y rurales en 15 regiones, con un marco conceptual de 203 ciudades del país. 
La recolección de datos se realizó a través de una encuesta de opinión en línea y el instrumento a utilizar fue un 
cuestionario estructurado compuesto principalmente por preguntas cerradas, de carácter simple y múltiple y otra parte, 
con cuestionarios no estructurados los cuales tuvieron como principal objetivo obtener una opinión acerca de la 
expectativa de los usuarios del sistema mixto de salud de Chile. La difusión fue por redes sociales y grupos de 
aplicaciones web. 


3.2. Análisis de los datos obtenidos 


Los datos obtenidos de la encuesta según la situación laboral presentan es mostrada en la Tabla 1, donde cerca 
del 60% de las personas trabajan tiempo completo o trabajan por cuenta propia (mipymes o negocio familiar), cerca 
de un 10% son dueño(a) de casa, solo un 5% trabaja tiempo parcial, y un porcentaje de estudiantes que alcanza no 
alcanza el 20% (en su mayoría universitarios). 

La Figura 1 muestra la distribución de edades de los encuestados. La mayoría de las personas que respondieron 
se encuentran entre los 30 y 50 años, seguido de personas entre 20 y 30 años y en menos cantidad personas mayores 
a 50 años. Los segmentos con más representación corresponden a la edad productiva por lo que coincide con la 
situación laboral obtenida. La mayoría de las personas que respondieron la encuesta son mujeres que representan un 
70.64% del total obtenido, por otro lado, los hombres representan un 29,36%. 

Se revisó el nivel de ingreso de las personas (Fig. 2), en su mayoría no superaron los $200.000. Si bien es posible 
que exista sesgo en los datos entregados por las personas, aproximadamente un 30% de las personas respondieron que 
esa era la opción que mejor representa sus ingresos. Por otro lado, un 21% de las personas señalaron tener ingresos 
sobre los $1.200.000, y el restante en un rango entre 200.000 y 1.000.000 (Clase media). 
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Tabla 1. Situación laboral presente en los datos recolectados 


Situación laboral Porcentaje N 
Estudiante 17 40 

Trabajo de tiempo completo 49 116 
Trabajo a tiempo parcial 5 11 
Trabaja por cuenta propia 11 25 
Sin trabajo, pero en búsqueda 6 15 
Sin trabajo y no busca 2 5 
Jubilado por edad legal 0.1 1 
Jubilado por motivos de salud 1 2 
Dueño(a) de casa 10 23 


Fuente: los autores 
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Figura 1. Distribución de edades 
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Figura 2. Distribución de nivel de ingresos 
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Una característica importante que se obtuvo de los datos recopilados es la cantidad de personas que si bien no 
necesitan ayuda para dirigirse a los centros médicos (7,23%) donde asisten regularmente, si hay un gran porcentaje de 
personas que deben acompañar a pacientes (76,17%) para dirigirse hacia el centro de salud al que asisten. 

La Figura 3 muestra las preferencias de horarios para citas médicas, según rangos de edad. Independiente del 
rango de edad la preferencia es el “Horario A” de 08:30 a 10:00 horas, seguido del “Horario D” de 16:00 a 18:00 
horas, y un pequeño porcentaje que se encuentra en el “Horario F” que representa a las personas sin ninguna 
preferencia en particular. Igualmente, se buscó si había diferencia en la preferencia horaria en personas que padecían 
alguna enfermedad crónica, tenían hijos o por frecuencia de asistencia al servicio de salud. Sin embargo, las 
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Figura 3. Distribución de horarios por categorías y rango etario 


Otro aspecto que se consideró en los datos es el tipo de previsión que poseen los usuarios. La Tabla 2 muestra 
que la mayoría de las personas que respondieron la encuesta se atienden en centros de atención de salud pública, en 
donde no existen sistemas de toma de citas de médica automático, sino que cada usuario debe asistir al centro para 
tomar cita y ser atendido. 


Tabla 2. Tipo de Previsión de salud por estrato 


Previsión Porcentaje N 
Fonasa (A o B) 41 101 
Fonasa (C o D) 33 80 

Isapre 22 55 
Prais, Dipreca, Caprdena 3 8 
Otros 1 2 


Fuente: los autores 
4. RESULTADOS Y DISCUSIÓN 
4.1. Máquinas de aprendizaje usadas para asignación de horas 

Se usaron algoritmos de clasificación para asignar el horario de las citas de acuerdo con las características 
presentadas por cada usuario. Como datos de entrada se tienen todas las características que se lograron obtener de los 


usuarios. Y la salida es la clasificación de horarios compuesta de seis bloques horarios, A, B, C son horarios matutinos 
mientras que D, E, F son horarios vespertinos. 
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Árbol de Decisión 


La Tabla 3 muestra que para el algoritmo de árbol de decisión la precisión más alta se obtuvo desde una 
profundidad inicial igual a 7, con una precisión del 48,6% utilizando el criterio de Gini y un porcentaje del 30% de 
los datos para entrenamiento del algoritmo. 

Con los datos obtenidos se realizó una medición de manera independiente para los parámetros correspondientes. 
Bajo este caso se obtuvo una presión de 38,3% y una validación cruzada igual a 40% de presión con una desviación 
estándar de 0.07. 


Tabla 3. Resultados algoritmo: Árbol de decisión 


Nivel de profundidad Precisión (%) 
1 48.6122 
2 39.7959 
3 39.3878 
4 39.7959 
5 48.6122 
6 41.0204 
7 48.6122 
19 48.6122 


Fuente: los autores 


El algoritmo presenta una precisión promedio cercana al 50%, debido a la asertividad que se obtiene en la clase 
B (segundo horario preferente) sobre las demás clases en la matriz de confusión. Dicha matriz presenta los aciertos 
que obtuvo el algoritmo luego del entrenamiento, siendo la clase B la que registró casi el 90% de los aciertos en 
comparación con las demás clases presentes para la variable objetivo. 

En la Figura 4 se pueden ver los resultados del entrenamiento del algoritmo en la clasificación. Si la previsión es 
menor o igual a 1.5 y es verdadero pertenece a la clase=b, si es falso realizó otra pregunta; si el nivel de ingreso es 
menor igual a 4.5 entonces se generó otro nodo y se debió preguntar; si el nivel de ingreso es menor o igual a 1.5 y 
así sucesivamente. 


K-Vecinos más Cercanos 


En los resultados obtenidos para las pruebas con este algoritmo se utilizaron diferentes formas para la métrica, 
en cuanto a la distancia entre los puntos y la cantidad de vecinos para cada tipo de métricas. 

En el Tabla 4 se muestra el resumen de las pruebas para el algoritmo utilizando la métrica de Minkowsky, 
cantidad de vecinos desde 1 a 19, P = 2 y Weights = distance. La tabla 4, es un resumen de los datos originales 
obtenidos. 
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Figura 4. Resultado del árbol de decisión para predecir el horario de asignación de cita 


Para esta configuración de parámetros se obtiene una precisión mínima de 0.2942 con una cantidad de vecinos 
igual a 1 y una precisión máxima de 0.4092 con una cantidad de vecinos igual a 19, 


Tabla 4. Resultados algoritmo: Árbol de decisión 


Kk= Precisión (%) 

1 29.4384 

12 39.2029 

13 37.9348 

14 37.5181 

15 40.0 

16 40.0725 

17 39.2391 

18 40.0543 

19 40.9239 


Fuente: los autores 


Para la creación del algoritmo final se seleccionan los parámetros que entregan una mayor precisión. En este 
caso el último registro de parámetros. La precisión del algoritmo final es de 42,5% con una validación cruzada igual 
a 40% y una desviación estándar de 0.05. Posterior a ello se realizó el reporte de clasificación donde se obtuvieron 
precisiones bastante altas para las clases B, C y E, de igual manera que el valor de recall o la sensibilidad para esas 
clases fueron mayores respecto a los otros algoritmos analizados, donde la clase B tuvo un asertividad del 89%, luego 
C y E con un 20% para cada clase. 
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Figura 5. Resultado del algoritmo K-Vecinos más cercanos para predecir el horario de asignación de cita 


La Figura 5 muestra el límite de decisión para el algoritmo de K-Vecinos más Cercanos con los parámetros 
seleccionados en un principio, donde la clase B se representa con la forma 1 (triángulo), la clase C con la forma 
2(circulo verde) y la clase E se representa con la forma 4 (triángulo invertido). En esta figura se puede ver que las tres 
clases (B, C y E) mencionadas anteriormente son prácticamente las únicas que se pueden visualizar. 

Las demás clases no se visualizan en la figura del límite de decisión debido a que, al tener menor cantidad de 
registros en la base de datos utilizada, es posible que estas quedaran fuera del conjunto de datos utilizados para entrenar 
el algoritmo y debido a esto las predicciones para estas clases faltantes (A, D y F) no fueron precisas. 


Máquinas de Soporte Vectorial 


En este algoritmo se obtuvieron resultados similares para diferentes grupos de parámetros. Como se muestra en 
el cuadro V, se configuraron tanto el valor de kernel, y C. Este cuadro es un resumen de los datos originales obtenidos. 
Para los kernels de tipo lineal, gaussiano y polinomial, además de un valor de C desde 0.05 hasta 1.00 se obtuvo una 
precisión promedio de 41,8% en cada conjunto de parámetro, en cambio para un kernel de tipo sigmoide y 
manteniendo los mismos valores para C, se obtuvieron diferentes niveles de precisión para los algoritmos, con un 
promedio final de 36,6%. 


Tabla 5. Resultados algoritmo Máquinas de Soporte Vectorial 


Kernel C Precisión media (%) 
Linear 0.05 a 1.00 41.85 
Poly 0.05 a 1.00 41.85 
RBF 0.05 a 1.00 41.85 
Sigmoide 0.05 a 1.00 36.57 


Fuente: los autores 


Aun así, se seleccionaron los parámetros que entregan una mejor precisión para la creación del algoritmo final 
para realizar una gráfica del limite de decisión para cada una de las clases de salida del algoritmo. Esto se puede 
observar en la Fig. 6, donde se muestra el límite de la región de decisión de cada clase. Aquí se puede observar que al 
igual que el algoritmo K-Vecinos más Cercanos, las categorías que se pueden visualizar son la B, C y E cada una con 
su identificador. Este algoritmo se descartó debido a que en los límites de decisión para la categoría B, las 
observaciones se mezclan con la categoría C, por lo tanto, al realizar una predicción para la selección de una categoría 
de horario con características de tipo C se obtendría en el 80% de los casos una predicción de tipo B. 
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Figura 6. Resultado del algoritmo Máquina de soporte vectorial para predecir el horario de asignación de cita 


Naive Bayes 


Los resultados obtenidos en estas pruebas entregan una precisión del algoritmo igual a 21,27% y una validación 
cruzada de 33% con una desviación estándar de 0.11, como se muestra en el cuadro VI, lo que deja a este algoritmo 
como el menos preciso de todos. Tabla 6 muestra un resumen de los datos originales obtenidos. 


Tabla 6. Resultados algoritmo: Naive Bayes 


Métrica de validación Valor Desviación 
Score 0.2127 
cross_val_score 0.33 [+-0]. 11 


Fuente: los autores 


Al igual que en las pruebas anteriores se realizó el reporte de clasificación donde se muestran diferentes métricas 
para la predicción del algoritmo. En este caso solo se obtuvieron precisiones mayores a cero para las categorías B y 


F, con 11 y 5 pruebas respectivamente. 


SVM:Límite de la región de decisión con 'kernel'= sigmoid y 'C' =0.5 
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Figura 7. Resultado del algoritmo Naive Bayes para predecir el horario de asignación de cita 
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En la Figura 7 se puede ver el límite de región de decisión que se obtuvo del algoritmo, donde claramente se 
puede ver que la región con mayor área es la categoría B correspondiente a la figura 1 (triángulo) y en la parte inferior 
se visualiza la categoría F que tiene solo unos pocos registros. 


4.2. Elección del mejor algoritmo 


El algoritmo seleccionado para la implementación en el sistema es K-vecinos más cercano, esto se debe a que 
fue el único algoritmo que logró predecir más de 2 clases o categorías al momento de realizar las pruebas y para efecto 
de las pruebas fue el algoritmo con la mayor precisión. 

Además, desde las gráficas de decisión fue el único algoritmo que logró agrupar de mejor manera las 
observaciones en cuanto a la variable de salida o clase categórica, en comparación con el algoritmo de árbol de decisión 
que para el total de los casos solo se clasificaba para una sola salida (categoría B) por lo que en el momento de realizar 
las predicciones aún con diferentes parámetros siempre se obtuvo como salida la categoría B. Cabe destacar que los 
datos que se lograron obtener están sesgados por lo que la salida de los algoritmos no es la más acertada y su 
implementación es cuestionable más tratándose de sistemas de salud. 


CONCLUSIONES 


Esta investigación propuso un sistema de gestión de reserva de citas con algoritmos de aprendizaje automático, 
capaz de predecir la hora ideal para una o varias personas según ciertos atributos que fueron utilizados para entrenar 
al algoritmo implementado. 

Durante el proceso de análisis de los datos fue necesario realizar diversos procesos para obtener un conjunto de 
datos depurado y completo y así realizar las pruebas requeridas para cada algoritmo. En este análisis se evidenció que 
gran parte de las personas que respondieron la encuesta, siempre prefieren una cita médica durante la mañana, esto se 
debe a que en su mayoría las personas trabajan tiempo completo, tienen hijos dependientes de los padres o tutores, o 
que de alguna manera siempre es preferible invertir tiempo en las citas médicas durante la mañana que en la tarde. 

La propuesta de un algoritmo que permita la asignación de citas médicas de acuerdo con el perfil del paciente 
debe ser estudiada con mayor profundidad ya que la precisión obtenida está por debajo de los valores esperados. Es 
por esta razón que para poder realizar la implementación en un sistema es necesario revisar los datos de origen con 
los cuales se entrenó el algoritmo y evitar los sesgos en los datos adquiridos, esto con el fin de mejorar la precisión y 
asignación en los sistemas APS. 

Es importante señalar que la investigación entrega las bases para futuras investigaciones para el desarrollo de 
sistemas inteligentes centrados en mejorar la calidad de vida de las personas y especialmente de los más necesitados, 
mejorando el sistema de gestión de citas médicas en recintos de salud primario, donde el colapso en la atención y 
movimiento médico es un tema que se discute abiertamente y que puede sentar las bases para una mejora sustancial 
en cuanto a tiempo y recursos invertidos. 
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